Итерационное извлечение шаблонов описания событий по новостным кластерам (Iterative Pattern Extraction Using News Clusters)

نویسندگان

  • Dmitry Kotelnikov
  • Natalia V. Loukachevitch
چکیده

В статье описывается метод итерационного формирования шаблонов описания событий по новостным кластерам. Небольшое количество размеченных примеров используется для построения базовых шаблонов, которые обогащаются за счет вариативности описания события в новостных сообщениях близкой тематики. Проведены эксперименты, в которых показана возможность формирования шаблонов для различных типов отношений.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Сеть естественных иерархий терминов новостных текстов по событиям «Евромайдана» (Network of Natural Hierarchies of Terms of News Messages on the "Euromaydan" Events)

Построение большой тематической онтологии – сложная и затратная проблема. Определенным этапом разработки общих онтологий является формирование словарных номенклатур, терминологических онтологий. Эффективный автоматический отбор отдельных терминов для таких конструкций на основании неразмеченных текстовых массивов – не решенная окончательно задача [5, 6]. Проблема автоматического установления св...

متن کامل

Notes on Electronic Lexicography

Эти заметки являются продолжением темы, затронутой в статье В. Селегея Электронные словари и компьютерная лексикография. Речь пойдет о том, каким может быть электронный словарь, имеющий в качестве объекта описания близкородственные языки. Очевидно, такая постановка вопроса допускает несколько вариантов ответов, а единственным подтверждением правильности каждого из них мог бы стать словарь или с...

متن کامل

Методы автоматического построения формализованного представления содержания материалов электронных средств массовых коммуникаций для решения задачи мониторинга и оценки деятельности органов власти (Methods for Automatic Construction of a Formalized Representation of the Contents of Electronic Mass Communication Materials to Solve the Problem of Monitoring and Assessment of Authorities)

В данной статье рассматриваются возможности создания формализованного представления информационных публикаций в сети Интернет для получения показателей количественной оценки деятельности органов власти по материалам таких публикаций. Также рассматриваются методы построения формализованного описания информационных сообщений и методы адаптации автоматизированных средств семантической обработки со...

متن کامل

Query expansion in information retrieval : What Can We learn from a Deep analysis of Queries?

Одна из основных задач информационного поиска—извлечение документов, релевантных информационной потребности пользователя, выраженной запросом. Зачастую пользовательские запросы не превосходят 3 слов, что усложняет задачу. Многочисленные исследования показали, что автоматическое расширение запроса в среднем повышает точность, несмотря на то, что для некоторых запросов результаты ухудшаются. В ст...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012